{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "1. 为什么要引入核函数？（10分）\n",
    "当我们在解决线性不可分的问题时，我们需要通过一个映射函数，把样本值映射到更高维的空间或者无穷维。在特征空间中，我们对线性可分的新样本使用前面提到过的求解线性可分的情况下的分类问题的方法时，需要计算样本内积，但是因为样本维数很高，容易造成“维数灾难”，所以这里我们就引入了核函数，把高维向量的内积转变成了求低维向量的内积问题。\n"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "2. 给出合页损失的数学形式并画出图形。（10分）\n",
    "合页损失的数学形式为：\n"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "![](img/1.png)\n",
    "\n"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "其图形如下图所示：![](img/2.png)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "3. 什么是支持向量？为什么SVM中只有一小部分的训练样本是支持向量（稀疏的）？（10分）\n",
    "\n",
    "最优解（具有“最大间隔”的决策面）对应的两侧虚线所穿过的样本点，就是SVM中的支持样本点，称为“支持向量”。例如下图所示的穿过虚线的三个点。\n",
    "![](img/3.png)\n",
    "支持向量是有决策面和最大间隔边界来决定的，决策面就是为了将样本数据尽可能多的完全分隔开，且间隔最大，支持向量只会是小部分，支持向量要是多了，说明决策面选择错误。"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "4. 决策树中特征分裂的准则有哪些？（10分）\n",
    "\n",
    "流行的决策树算法有：ID3、C4.5和CART，这些不同决策树方法区别即在于：特征分裂的准则不同。\n",
    "• ID3：信息增益最大（对标签𝑌提供信息最多的特征），倾向于选择取值多的特征进行分裂。\n",
    "• C4.5：ID3的改进，信息增益率最大。\n",
    "• CART：分裂后两个分支的样本越纯净越好，纯净就是指分裂后的分支内的样本的y值越接近越纯净。\n",
    "\n",
    "5. SVM模型并没有概率解释。为了使SVM模型能输出概率，我们应该设置哪个参数？（10分）\n",
    "\n",
    "设置probability来支持概率输出，是通过Logstic回归来转换的，支持概率估计会降低速度，需要在训练（fit）之前设置。 如果要将LinearSVC的输出转换成概率，可通过概率校准工具CalibratedClassifierCV实现概率转换。\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.7.3"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
